import pandas as pd

df = pd.read_excel("北京10年天气数据.xlsx", engine="openpyxl")

df.drop(columns=["空气质量指数"], inplace=True)

print(df.head())


def get_wendu(row, ptype):
    wendu = row[ptype]
    wendu = wendu.replace("°", "")
    if not wendu:
        wendu = '0'
    wendu = int(wendu)
    return wendu


df["最高温"] = df.apply(get_wendu, args=('最高温',), axis=1)
df["最低温"] = df.apply(get_wendu, args=('最低温',), axis=1)


# df["最低温"] = df["最低温"].map(get_wendu)


def get_date_week(row):
    data = row["日期"].split()
    return data[0].strip(), data[1].strip()


df[['日期', '星期']] = df.apply(get_date_week, axis=1, result_type="expand")

df.sort_values(by="日期", ascending=False, inplace=True)
df.to_excel("北京天气数据.xlsx", index=False)
